بازشناسی گفتار فارسی با استفاده از واحدهای زیرکلمه ای و اطلاعات مربوط به مرز

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • نویسنده ایمان صراف رضایی
  • استاد راهنما فرشاد الماس گنج
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1387
چکیده

بهبود نتایج بازشناسی سیستم های بازشناس خودکار گفتار، یکی از عرصه های مهم پیش روی محققان حوزه پردازش و بازشناخت گفتار است. علی رغم فعالیت های انجام یافته، نتایج به دست آمده از این سیستمهای ماشینی هنوز به نتایج بازشناسی سیستم شنوایی انسان نرسیده است. بناباین از آنجا که عملکرد سیستم بازشناسی گفتار در مقایسه با بازشناس های معمولی ماشینی محسوب می گردد، می توان امید داشت که با الهام گرفتن از عملکرد سیستمی و فیزیولوژیکی سیستم شنوایی انسان، نتایج بازشناسی این ماشین ها بهبود یابند. یکی از روش هایی که می توان به وسیله آن دقت بازشناسی واج سیستم را در شرایط تمیز و نویزی بهبود بخشید، استفاده از واحدهای زیر کلمه ای بزرگتر از واج می باشد، بازشناسی خوکار واج ها در گفتار پیوسته بسیار مشکل می باشد، زیرا تشخیص یک واحد توسط حس شنیداری فقط مربوط به آن واج نیست، بلکه قطعات مجاور آن نیز روی درک آن اثر می گذارند. تحقیقات محققان نشان می دهند که راه طبیعی درک یک زبان توسط مغز انسان بوسیله نگه داری و درک هجا می باشد و نه واج. همچنین سیستم شنوایی انسان قادر است تقریبا 200 میلی ثانیه از سیگنال گفتار را بدون اینکه اطلاعات مهم آن از بین برود، درک کند، که این مقدار، همبستگی مناسبی با طول یک هجا دارد. علاوه بر اینها طول زمانی هجا، کمتر از طول زمانی واج، به تغییرات نرخ صحبت گوینده وابسته می باشد. واحدهای زیر کلمه ای بزرگتر از واج به دلیل اینکه شامل فریم های زمانی بیشتری نسبت به آواها هستند، بهتر می توانند تغییرات تلفظی موجود در گفتار را مدل کنند. بسیاری از ویژگی های پروزودیک گفتار نیز با استفاده از هجاها، آسانتر و بهتر مدل می شوند. همچنین بهبود دقت و مقاومت بازشناسی با افزودن اطلاعات مرزهای واحدهای زیر کلمه ای با سامانه بازشناسی گفتار نیز تایید شده است . هدف از وارد کردن اطلاعات مرز، افزایش کارایی بازشناسی و کاهش زمان بازشناسی و همچنین مقاوم کردن سیستم در مقابل نویز می باشد. ما در این پایان نامه از واحدهای زیر کلمه ای بزرگتر از واج، در سیستم بازشناسی گفتار پیوسته زبان فارسی استفاده نمودیم. به این منظور واحدهای مختلفی مانند نیم هجا، هجا و واحدهای cv را به شکل های مختلف مورد آزمایش قرار دادیم. نتایج آزمایشات نشان می دهند که استفاده از واحدهای cv نسبت به بقیه واحدها، دقت و صحت سیستم را بیشتر افزایش می دهد. استفاده از این واحد، دقت سیستم بازشناسی واج گفتار تمیز و گفتار آلوده به نویز سفید 10db را به ترتیب حدود 5/5 درصد و 5/4 درصد، افزایش بخشید. کار دیگری که در این پایان نامه انجام شد، استفاده از اطلاعات مرز در سیستم بازشناسی گفتار بود. برای این کار ما اطلاعات مرز را به صورت یک بردار ویژگی، به ویژگی های معمول بازشناسی اضافه کردیم. این اطلاعات مرز را به صورت های مختلفی تعریف و تست نمودیم. با توجه به آزمایش های انجام شده به این نتیجه رسیدیم، که هنگامی که محل وقوع واج را به صورت یک ویژگی اضافی به سیستم بدهیم، این امر باعث افزایش مقاومت سیستم در برابر نویز می گردد. برای مثال دقت بازشناسی با استفادهاز این ویژگی و برای گفتار آلوده به نویز سفید، حدود 4%بهبود پیدا می نماید. برای بازشناس مرز واج از یک شبکه عصبی tmlp استفاده نمودیم.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

روشی کاربردی برای بازشناسی برخط حروف مجزای دست‌نویس فارسی با استفاده همزمان از دانش مربوط به بدنه اصلی و ریزحرکات

در این مقاله، روشی برای بازشناسی برخط حروف مجزای دست‌نویس فارسی ارایه می‌شود. در روش پیشنهادی برای بازشناسی حروف مجزای دست‌نویس فارسی، از دانش مربوط به بدنه اصلی و ریزحرکات به‌طور همزمان و به‌منظور اعتبار بیشتر تعیین کلاس خروجی استفاده شده‌است. در این تحقیق حروف مجزای دست‌نویس فارسی بر اساس تشابه بدنه اصلی در 18، و بر اساس تشابه ریزحرکات در 11 گروه، گروه‌بندی می‌شوند. با توجه به روش پیشنهادی ار...

متن کامل

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

متن کامل

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

متن کامل

بازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی

حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...

متن کامل

بازشناسی احساس از روی گفتار پیوسته فارسی

در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. مدل پیشنهادی در این پایان نامه از گفتار پیوسته فارسی برای بازشناسی احساس استفاده می کند. بازشناسی احساس از گفتار بر روی زبان های مختلفی انجام شده اما بر روی زبان فارسی تا کنون این چن...

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023